AI资讯新闻榜单内容搜索- LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

微软副总裁X上「开课」，连更关于RL的一切，LLM从业者必读

微软副总裁X上「开课」，连更关于RL的一切，LLM从业者必读

微软副总裁X上「开课」，连更关于RL的一切，LLM从业者必读

别人都在用 X 发帖子，分享新鲜事物，微软副总裁 Nando de Freitas 却有自己的想法：他要在 X 上「开课」，发布一些关于人工智能教育的帖子。该系列会从 LLM 的强化学习开始，然后逐步讲解扩散、流匹配，以及看看这些技术接下来会如何发展。

来自主题: AI资讯

10235 点击 2025-05-26 17:18

强迫模型自我争论，递归思考版CoT热度飙升！网友：这不就是大多数推理模型的套路吗？

强迫模型自我争论，递归思考版CoT热度飙升！网友：这不就是大多数推理模型的套路吗？

强迫模型自我争论，递归思考版CoT热度飙升！网友：这不就是大多数推理模型的套路吗？

递归思考 + 自我批判，CoRT 能带来 LLM 推理力的飞跃吗？

来自主题: AI技术研报

7377 点击 2025-05-12 15:27

ICML 2025 Spotlight｜华为诺亚提出端侧大模型新架构MoLE，内存搬运代价降低1000倍

ICML 2025 Spotlight｜华为诺亚提出端侧大模型新架构MoLE，内存搬运代价降低1000倍

ICML 2025 Spotlight｜华为诺亚提出端侧大模型新架构MoLE，内存搬运代价降低1000倍

Mixture-of-Experts（MoE）在推理时仅激活每个 token 所需的一小部分专家，凭借其稀疏激活的特点，已成为当前 LLM 中的主流架构。然而，MoE 虽然显著降低了推理时的计算量，但整体参数规模依然大于同等性能的 Dense 模型，因此在显存资源极为受限的端侧部署场景中，仍然面临较大挑战。

来自主题: AI技术研报

8209 点击 2025-05-07 09:30

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

该研究对 LLM 常见的失败模式贪婪性、频率偏差和知 - 行差距，进行了深入研究。

来自主题: AI技术研报

9010 点击 2025-05-06 09:23

被Transformer光芒掩盖的论文，Meta科学家回顾十年前创新之作

被Transformer光芒掩盖的论文，Meta科学家回顾十年前创新之作

被Transformer光芒掩盖的论文，Meta科学家回顾十年前创新之作

这篇论文包含了当前 LLM 的许多要素，十年后的今天或许仍值得一读。

来自主题: AI技术研报

8812 点击 2025-05-02 15:32

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述

现如今，微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。

来自主题: AI技术研报

9066 点击 2025-05-02 14:03

上交大推出首个AI智能体协议全面综述：从碎片化到互联互通的智能体网络

上交大推出首个AI智能体协议全面综述：从碎片化到互联互通的智能体网络

上交大推出首个AI智能体协议全面综述：从碎片化到互联互通的智能体网络

随着大语言模型 (LLM) 技术的迅猛发展，基于 LLM 的智能智能体在客户服务、内容创作、数据分析甚至医疗辅助等多个行业领域得到广泛应用。

来自主题: AI技术研报

8812 点击 2025-04-30 15:05

被《经验时代》刷屏之后，剑桥博士长文讲述RL破局之路

被《经验时代》刷屏之后，剑桥博士长文讲述RL破局之路

被《经验时代》刷屏之后，剑桥博士长文讲述RL破局之路

RL + LLM 升级之路的四层阶梯。

来自主题: AI技术研报

8943 点击 2025-04-24 18:21

迈向推理时代：900+篇参考文献揭示长链思维的前世今生，最全综述来了

迈向推理时代：900+篇参考文献揭示长链思维的前世今生，最全综述来了

迈向推理时代：900+篇参考文献揭示长链思维的前世今生，最全综述来了

近年来，大模型（Large Language Models, LLMs）在数学、编程等复杂任务上取得突破，OpenAI-o1、DeepSeek-R1 等推理大模型（Reasoning Large Language Models，RLLMs）表现尤为亮眼。但它们为何如此强大呢？

来自主题: AI技术研报

10004 点击 2025-04-16 15:00

阿里智能化研发起飞！RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

阿里智能化研发起飞！RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

阿里智能化研发起飞！RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

RTP-LLM 是阿里巴巴大模型预测团队开发的高性能 LLM 推理加速引擎。它在阿里巴巴集团内广泛应用，支撑着淘宝、天猫、高德、饿了么等核心业务部门的大模型推理需求。在 RTP-LLM 上，我们实现了一个通用的投机采样框架，支持多种投机采样方法，能够帮助业务有效降低推理延迟以及提升吞吐。

来自主题: AI技术研报

8474 点击 2025-04-14 15:13

上一页当前第11页,共25页下一页